花了1000倍的token,效果可能却没有更好:AI Agent的“隐性账单”长什么样
花了1000倍的token,效果可能却没有更好:AI Agent的“隐性账单”长什么样如今的 AI Agent 正在大规模落地,其中应用最广且最受关注的当数 Claude Code,Codex,Cursor 这类 coding agent。过去的一年里,这类 coding agent 产品迭代迅速,在一年内将在 swe-bench- verified 的准确率提高到了 78%+。
搜索
如今的 AI Agent 正在大规模落地,其中应用最广且最受关注的当数 Claude Code,Codex,Cursor 这类 coding agent。过去的一年里,这类 coding agent 产品迭代迅速,在一年内将在 swe-bench- verified 的准确率提高到了 78%+。
Cursor 正式接入 Claude Opus 4.7 Fast mode——同一个旗舰模型,拆出两个速度档。快 2.5 倍,贵 6 倍,输出价每百万 token 150 美元。最离谱的是,Cursor 官方在发布当天就建议:多数任务请用标准速度。
俺做滴 我做了一个给 Agent 用的网盘,叫 neuDrive.ai,开源的 你在 Claude、Codex、Cursor 这些工具里攒下来的 skill、记忆、文件,可以通过 neuDrive 一键备份、相互同步
上个月刚充了 ChatGPT Plus,这个月又买了Cursor Pro,OpenClaw 也研究的差不多了。我们对 AI 的期待,说起来非常简单:给最好的方案、最准确的代码、最精确的回答。
最近几个月,Vibe Coding(氛围编程)是一大刷屏热词。以 Cursor 和 Claude Code 为代表的一批工具,正在将软件开发效率推向新的高度。
新鲜大瓜!Cursor 3.0实锤套壳Claude Code。当Cursor 3.0被开发者一层层拆开,大家才猛然发现:这场翻车真正刺痛行业的,不是它用了Claude,而是它试图把别人的大脑,包装成自己的灵魂。
昨晚,一个 X 上的泄露账号曝光了 Claude Code 即将上线的更新:截图验证、安全扫描、设计探索、暗黑模式、登录系统、跨多个代码仓库的统一工作界面。网友们的评价是:「这可能是 Lovable 的全栈竞争对手」,危险危险危险。
今天早上,Cursor 在X上发布一条推文:“我们重建了 MoE 模型在 Blackwell GPU 上生成 Tokens 的方式,导致推理速度快了 1.84 倍。”
就在今天凌晨,Cursor 3正式发布!自Cursor诞生以来的最大一次飞跃!X上Cursor的官方账号上发布的推文写得极其大胆:为所有代码都由Agent编写而建的世界,同时保持开发环境的深度
3 月 20 日,知名 AI 代码编辑器 Cursor 高调发布了所谓的编程模型 Composer 2,结果被网友质疑「套壳」 Kimi K2.5。而从官方口径来看, Composer 2 的性能简直是降维打击:全基准大幅领先前代,首次引入持续预训练,叠加大规模强化学习,能解决需要数百个操作的高难度编程任务。